最先进的音频源分离模型依赖于监督数据驱动方法,这在标记资源方面可能是昂贵的。另一方面,在没有任何直接监管的情况下训练这些模型的方法通常在记忆和时间要求方面都是高要求的,并且在推理时间使用不切实际。我们的目标是通过提出一种简单但有效的无监督分离算法来解决这些限制,该算法直接在时域信号的潜在表示上运行。我们的算法依赖于预先训练的自回归网络形式的深贝叶斯前沿来模拟每个来源的概率分布。我们利用离散潜空间的低基数,培训具有新的损失术语,对其进行精确的算术结构,在不依赖于近似策略的情况下执行精确的贝叶斯推理。我们在Slakh Dataset Arxiv验证了我们的方法:1909.08494,展示了符合现有技术的导致监督方法,同时需要对其他无人监督的方法进行更少的资源。
translated by 谷歌翻译